Un nouveau modèle pour la classification non supervisée sous contraintes

نویسندگان

  • Thi-Bich-Hanh Dao
  • Khanh-Chuong Duong
  • Christel Vrain
چکیده

Constrained clustering is an important task in Data Mining. In the last ten years, many works have been done to extend classical clustering algorithms to handle user-defined constraints, but they are in general limited to one kind of constraints. In our previous work (Dao et al., 2013a), we have proposed a declarative and general framework, based on Constraint Programming, which enables to design a clustering task by specifying an optimization criterion and different kinds of user-constraints. The model is designed for a clustering task, where data is divided in exactly k clusters. In this paper, we present a new model for constrained clustering tasks where the number of clusters is only bounded. It offers more flexibility, while being more efficient and experiments show that it has a better performance, when compared to existing complete methods dealing with the same criteria. MOTS-CLÉS : classification non supervisée, contraintes utilisateur, programmation par contraintes.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Une approche en programmation par contraintes pour la classification non supervisée

Résumé. Dans cet article, nous abordons le problème de classification non supervisée sous contraintes fondé sur la programmation par contraintes (PPC). Nous considérons comme critère d’optimisation la minimisation du diamètre maximal des clusters. Nous proposons un modèle pour cette tâche en PPC et nous montrons aussi l’importance des stratégies de recherche pour améliorer son efficacité. Notre...

متن کامل

Classification probabiliste non supervisée et visualisation des données séquentielles

Résumé. Nous proposons dans ce papier un nouvel algorithme de classification non supervisée à base de modèle de mélange topologique pour des données non i.i.d (non independently and identically distributed). Ce nouveau paradigme probabiliste, plonge les cartes topologiques probabilistes dans une formulation sous forme de chaînes de Markov cachées. Dans cette formulation, la génération d’une obs...

متن کامل

Classification structurée pour l'apprentissage par renforcement inverse

Résumé : Cette contribution traite du problème de l’apprentissage par imitation par le biais de l’apprentissage par renforcement inverse (ARI). Dans ce contexte, un expert accomplit une tâche qu’un agent artificiel doit essayer de reproduire. L’ARI part du postulat que l’expert optimise avec succès une fonction de récompense ; le problème consiste à deviner cette fonction à partir de traces du ...

متن کامل

Conception, modélisation géométrique et contraintes en CAO : une synthèse

RÉSUMÉ. Les logiciels de CAO ont pour perspective de devenir de véritables outils d’aide à la conception d’objets physiques. Mais la conception préliminaire reste un domaine de recherche largement ouvert. Cet article de synthèse s’efforce de montrer qu’une approche par contraintes du processus de conception est incontournable pour atteindre ce but. La conception est vue ici comme un processus c...

متن کامل

Sélection de variables non supervisée sous contraintes hiérarchiques

Résumé. La sélection des variables a un rôle très important dans la fouille de données lorsqu’un grand nombre de variables est disponible. Ainsi, certaines variables peuvent être peu significatives, corrélées ou non pertinentes. Une méthode de sélection a pour objectif de mesurer la pertinence d’un ensemble utilisant principalement un critère d’évaluation. Nous présentons dans cet article un cr...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Revue d'Intelligence Artificielle

دوره 28  شماره 

صفحات  -

تاریخ انتشار 2014